IT之家 04-23 07:08

通义千问 Qwen3.6-27B 宣布开源:270 亿参数稠密模型,编程能力超越 15 倍规模 MoE 模型

📌 一句话:阿里开源270亿参数稠密模型Qwen3.6-27B,编程能力实测超越15倍规模MoE模型,效率与性能兼得。

💡 3个要点

  • 采用270亿参数稠密架构,训练推理资源消耗更可控,便于部署

  • 编程Benchmark实测表现优于参数规模大15倍的MoE模型

  • 开源发布,开发者可免费获取、部署和微调

📖 背景

MoE(混合专家)架构因参数利用率高成为大模型主流方向,但稠密模型在特定任务上的稳定性和效率仍具优势。

💭 点评

这不仅是技术突破,更是一次"反MoE"的技术宣言——证明架构规模不等于能力天花板。开源策略将加速AI应用普及,让更多中小企业和开发者能以更低成本用上顶级模型。对整个行业而言,稠密与MoE的竞争将推动大模型走向更务实、高效的发展路径。

码头码农 - 微信搜索关注